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) Verfahren zur Qualitatsbestimmung von RNA-Proben 

\ 

Die Erfindung betrifft ein Verfahren zur Qualitatsbestimmung von RNA-Proben nach 
idem Oberbegriff des Anspruchs 1. 

iRibonukleinsauren, in der englischen Sprache ribonucleic acids, abgekurzt RNA, 
sind in den Zellen aller Lebewesen und auch in einigen Viren enthaltene 
Biopolymere, die in verschiedener Form vor allem an der Ubersetzung der 
genetischen Information von DNA in Proteine beteiligt sind. Daher wird RNA fur die 
Untersuchungen des Genoms in MicroArray-Hybridisierungs-Experimenten und RT- 
PCR, auch beispielsweise fur Northern Blots, RNase-Protection-Assays oder cDNA- 
Synthese herangezogen. Das Resultat dieser Experiments und die Signifikanz der 
Ergebnisse sind in hohem Mafie von der Qualitat der verwendeten RNA-Proben 
abhangig. 

Die GrbRenverteilung von RNA-Biopolymeren dient als Mafistab fur die Intaktheit und 
damit die Qualitat der vorliegenden RNA-Probe. Die RNA-Gro&enverteilung variiert in 
Abhangigkeit von der Herkunft des Materials und der Praparationsmethode, wird 
jedoch mafcgeblich durch Kontamination mit RNA-degradierenden Enzymen 
(RNasen) oder durch mechanische Scherkrafte bei unsachgemafier Handhabung 
beeinflusst. In jedem Fall beobachtet man bei einer Degradation eine Verschiebung 
der RNA-Polymerlangen zu kleineren Grofien. 

RNA Biopolymere zeichnen sich dadurch aus, dass ihre Ladung nahezu proportional 
zu ihrer Lange ist. Eine Elektrophorese, d.h. eine Trennung von Molekulen nach 
ihrem Ladung/Masse-Verhaltnis in einem Substrat durch Anlegen eines elektrischen 
Feldes, eignet sich daher fur die Analyse der Grofcenverteilung einer RNA-Probe. 
Lab-on-a-Chip-Analysen mit dem Agilent 2100 Bioanalyzer bieten ein 
hpchreproduzierbares und hochauflosendes elektrophoretisches Verfahren. So 
5||^nnene digital vorliegende Elektropherogramme bilden daher eine ideale 
^lliB9?^ asis ft* d,e weitere Verarbeitung. 



\ ^^i¥ ict hklana nur manuell und daher mehr Oder 

'^***TZ ITU - von einen, edabrenen 
SUb T,nltr 0 P,« werden, bevor sie in wei.eren Bxperimen.en 
' ,d 1J^r«. — Anzab, der ******* - 

, . „, hei denen die Qualita. aufgrund eines Oder nur weniger 
U TTZ^l o "JLg be,e Ansa. — - .as 

MerKmaie abgesohaW 18S . rRNA . Fragments fes t. Intakte RNA-Proben 
la cbenverha,.n,s des forts cbrei.ender Degradierung wird das 

Uen - ^ ^ MBg|ichkeit 

iVerhaltnis immer kle.ner. Es b.etet starke 

fjproben angesehen. 

entwickeln. Das Vertanren ljnab hanqig von der biologischen 

Konzen.ra.ion und der Prapara.ionsme.bode der RNA-Proben. 



: Die Erfindung und ihre Vorteile 

S Das ennndungsgemaAe Vedahren mi. den MerKmaien des Ans^ochs 1 ha. 
•J gegenOber dem S.and der Tecnn, den Vodeil, dass die 
i obUen. einhei.,icben und reproduzierbaren Quailed cnar« war 
I Kdnnen. Dies erofme, neue MegiicnkeHen for die Qua. «o ^ 
I QuaMa.ssionerung, wie beispieisweise objekdve Quaii.msvergie.cbe von 
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ach einer vorteilhaften Ausgestaltung der Erfindung wird der Qualitatsalgorithmus 
rch folgeride Verfahrensschritte bestimmt: 

Anlegen einer statistisch signifikanten Versuchsmenge von RNA- 
Elektropherogrammen zu einer vorgegebenen Menge von RNA-Proben, 
i. Vorgabe eihes Qualitatskennzeichens q zu jedem Elektropherogramm, 
I. Extraktion moglichst. vieler aussagekraftiger Merkmale aus den 
f Elektropherogrammen mittels Methoden der Datenanalyse, 
9. Bestimmung funktionaler Zusammenhange zwischen Quaiitatskennzeichen und 
: bestimmten Merkmalskombintionen, beispielsweise mit einem adaptiven 
Verfahren, 

E. Zuordnung eines Gutewertes zu jedem der funktionalen Zusammenhange, 
bespielsweise die nach der Bayes'schen Methode ermittelte a posteriori 
Wahrscheinlichkeit, 

=. Bestimmung des funktionalen Zusammenhangs mit dem hochsten Gutewert als 
Qualitatsalgorithmus. 

Als Versuchmenge werden moglichst viele Elektropherogramme angelegt. Es ist 
besonders wichtig, dass die Versuchsmenge die Daten realer Anwendungen 
wiederspiegelt. 

Alle Proben werden im Vorfeld sorgfaltig mit einem Quaiitatskennzeichen versehen. 
Dieses Quaiitatskennzeichen ist die Zielgrofle, die fur die spatere Auswahl der 
besten MerkmalskOmbination und das Trainieren des neuronalen Netzes verwendet 
! wird. • 

'Die Qualitat einer RNA-Prpbe ist eine kontinuierliche Grofle, so dass sich keine 
,,naturlichen Qualitatsklassen ergeben. Daher werden nach einer weiteren 
•vorteilhaften Ausgestaltung der Erfindung diskrete Qualitatsklassen festgelegt 
■Beispielsweise konnen sieben Qualitatsklassen eingefuhrt werden. Die qualitativ 
i fschlechtesten RNA-Proben werden mit dem Quaiitatskennzeichen „1" versehen und 
I'm die erste Klasse eingeordnet. Die qualitativ etwas besseren RNA-Proben werden 
jmit „2" gekennzeichnet und in die zweite Klasse eingeordnet usw. Die qualitativ 
besten RNA-Proben enthalten schlieftlich das Kennzeichen J". 



X ^ hat den Vorteil, dass die beste Merkmalskombination fur die 
„ aHaDtive Ansatz nai uwi v. 

Utsbestimrnung automaton ausgewahlt wird und auf d.eser 
Irkmalskombination die Qualitat adaptiv gelernt wird. 

diesem Punkt stellt die Gesamtheit aller digitalen Elektropherogramme mit 
jehSrigen Qualitatskennzeichen q e {l,..,7}und die komplette Wissensbasis fur die 
literentwicklung des Verfahrens dar. 

as Ziel der Extraktion von Merkmalen a us den Elektropherogrammen ist es, a us 
m Elektropherogramm moglichst viele aussagekraftige Merkmale zu extrahieren. 
f in dungsgemall teilt man hierzu das Elektropherogramm in folgende Bereiche auf: 
re-Region, Marker-Region, 5S-Region, Fast-Region, IBS-Region. Inter-Region, 
3S-Region und Post-Region. 

eder dieser Bereiche wird anschlieBend getrennt betrachtet und liefert einige 
tereichsspezifische, sogenannte lokale Merkmale, die gemeinsam die Form des 
ilektropherogramms in dem betroffenen Bereich ausreichend genau beschreiben. 
jUerdem werden einige globale, d.h. bereichsubergreifende, Merkmale extrahiert. 
fas Ergebnis dieses V erfahrensschrittes ist eine Liste von beispielsweise ca. 100 
Merkmalen pro Elektropherogramm. 

|)ie Basis der Datenanalyse bildet eine Liste mit den im Elektropherogramm 
Irkannten Maxima, die als Peaks bezeichnet werden. Die Erkennung der Peaks wird 
|urch Integration der Datenkurve erreicht. Die Integration liefert neben der Position 
ier Peaks auch die Start- und Endpunkte der Peaks sowie deren Hohe, Breite und 
: lache. 

In Anlehnung an die Agilent 2100 Bioanalyzer System Software werden einige Peaks 
als ..Ladder Peak", ..Marker", „18S-Peak"- und ,.28S-Peak" markiert. Das neue 
Verfahren zur Integration und Markierung weist gegenuber dem Stand der Technik 
eine deutliche Weiterentwicklung Und Verbesserungen der Genauigkeit und der 
Robustheit gegen Anomalien wie „Ghost Peak" und „Spikes" auf. Gemafi der 
Erfindung stellt man dafur ein statistisches lineares Modell uber Position, Hone und 



P?fitfll?& peaks bereit.. Die vier Peaks in der Ladder, die 

P "ti: rM-Tpassen. werdee ais Ladder Peaks bezeiohnet 
birteam am besten ?u. 

markiert. 

, Me , p eak in der Ladder-is, der Lower-Marker, dessen Position Hohe 
ersta Ladder Peak « ^ bzw Rachen der 

,F,ach : b i a r 1e 2S^■.»-o*«''»^^>*-.• w • l, . 

M ° v u. in den Proben eines Chips berOcksiohtigt. Die 13 

ssen, werden ais Lower-Marker markiert. 

MA-Proben smd 1ob unu ^uo 

loheidba, ,n diesen FMen wird die gescnatzte Position der £ und 2 
eaks berecbnet. urn die naob.oigende Autteiiung ,n Bere,cbe fur 
lualitatsklassen zu ermoglichen. 

fe auf diese Weise erbaitene Markierung weicbt lediglicb in 0.8% der Faiie von der 
)ie auT aieb« manuellen 
nanuelien Markierung der ..Lower Marker" und .n 1 .2 /o der Falle 

Markierung der 1 8S- und 28S-Peaks ab. 
nweitererAusbi^^ 

ides Bektropberogramms in die oben e^abnten aobt ane.nander ang .nzende " 
Bereione, die den gesantfen Datenbereicb abdecken. Der Berercb vor *mU^r 
Lrke, wird ais Pre-Region bezeiobnet. Die Marker-Region deokt s ob r^ de. 
Leiob, den / der Lower-Marker-Peak einnimmt. Die 188- und 
Uecken sioh jeweils uber den 18S-Peak bzw. 28S-Peak. Zwischen Ma*er-Reg,on 
nd 18S-Region iiegen zwei Regionen, die 5S-Region und die Fas.-Reg,on. D,e 
Lefahre Grenze zwisehen diesen beiden Bereichen wird aus der Posrtron des 
Lower Makers und der 5.8S / 5S I tRNA Peaks in den Proben mil vorbandener 5.8S 
Lnd 5S rRNA sowie tRNA bestimmt und anhand der jeweiligen Positron des Lower 



|awsw^iai»s^?£v: Hef - zeichnung veranschaulicht die vorgenommene 
[ufteilung/- ; ; 

• Korrektur der Basislinie im Elektropherogramm, auch genannt Baseline, wird 
onfalls in Anlehnung an Agilent 2100 Bioanalyzer System Software mit 
esentlichen Verbesserungen vorgenommen. In den Bereichen Pre-Region und 
,st-Region verlauft die Baseline bis auf das Rauschen idealerweise auf einem 
|nstanten Niveau. Das Niveau kann von Elektropherogramm zu 
fektropherogramm sehr unterschiedliehe Werte annehmen. In einigen Fallen kann 
ie Baseline auch eine Steigung oder gar Wellen aufweisen. Letzteres stellt ein 
sutliches Indiz fur ein aufgetretenes Problem wahrend der Datenakquisition dar. 



»er Grundgedanke der Baseline-Korrektur besteht darin, den konstanten, oder den 
lit der Zeit proportionalen zu- bzw. abnehmenden Hintergrundanteil aus dem 
iatensignal zu entfernen. Dazu wird erfindungsgemafi versucht, eine Gerade zu 
fnden, die in den Bereichen Pre-Region und Post-Region mit dem Datensignal bis 
iuf das Rauschen ubereinstimmt, d.h. die im Mittel urn Noise Standard Deviation 
j noise von dem Datensignal abweicht. Fur die Berechnung der Noise Standard 
deviation o . wird die ubliche aus der Literatur bekannte Formel benutzt. 

noise 

\ ' ■ - 

for der eigentlichen Merkmalsextraktion wird das Datensignal auf das globale 
|aximum in, der 5S-Region, der Fast-Regiort, der 18S-Region, der Inter-Region und 
ler 28S-Region normiert. Die Marker-Region wird hier aulier Acht gelassen, urn auf 
iese Weise verschiedene Konzentrationen besser zu handhaben. 



eben der ursprunglichen Datenkurve verwendet man weitere geglattete 
atenkurven. Zur Glattung der Datenkurve verwendet man vorzugsweise den 
avitzky-Golay-Filter und den Rollingball-Algorithmus nach EP 0 969 283 A1 . 

iir alle Regionen bieten sich folgende lokale Merkma|e zur Extraktion aus der 
rsprunglichen und den geglatteten Datenkurven an: 
• Minimaler/ Maximaler Wert im Bereich 
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